Pre-Training MLM Using Bert for the Albanian Language

نویسندگان

چکیده

Abstract Knowing that language is often used as a classifier of human intelligence and the development systems understand remains challenge all time (Kryeziu & Shehu, 2022). Natural Language Processing very active field study, where transformers have key role. Transformers function based on neural networks they are increasingly showing promising results. One first major contributions to transfer learning in was use pre-trained word embeddings 2010 (Joseph, Lev, Yoshua, 2010). Pre-trained models like ELMo (Matthew, et al., 2018) BERT (Delvin, 2019) trained large corpora unlabeled text result from representations has achieved good performance many underlying tasks datasets different domains. Pre-training model proven there been an improvement some aspects natural processing, paper (Dai Le, 2015). In present paper, we will pre-train task Masked Modeling (MLM) with Albanian dataset (alb_dataset) created for this purpose We compare two approaches: training using available OSCAR our alb_dataset collected. The shows discrepancies during training, especially while evaluating model.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

the use of appropriate madm model for ranking the vendors of mci equipments using fuzzy approach

abstract nowadays, the science of decision making has been paid to more attention due to the complexity of the problems of suppliers selection. as known, one of the efficient tools in economic and human resources development is the extension of communication networks in developing countries. so, the proper selection of suppliers of tc equipments is of concern very much. in this study, a ...

15 صفحه اول

the impact of training on second language writing assessment: a case of raters’ biasedness

چکیده هدف اول این تحقیق بررسی تأثیر آموزش مصحح بر آموزش گیرندگان براساس پایایی نمره های آنها در پنج بخش شامل محتوا ، سازمان ، لغت ، زبان و مکانیک بود. هدف دوم این بود که بدانیم آیا تفاوتهای بین آموزشی گیرندگان زن و مرد در پایایی نمرات آنها وجود دارد. برای بررسی این موارد ، ما 90 دانشجو در سطح میانه (متوسط) که از طریق تست تعیین سطح شده بودند انتخاب شدند. بعد از آنها خواستیم که درباره دو موضوع ا...

15 صفحه اول

the effect of using model essays on the develpment of writing proficiency of iranina pre-intermediate efl learners

abstract the present study was conducted to investigate the effect of using model essays on the development of writing proficiency of iranian pre-intermediate efl learners. to fulfill the purpose of the study, 55 pre- intermediate learners of parsa language institute were chosen by means of administering proficiency test. based on the results of the pretest, two matched groups, one as the expe...

Feed forward pre-training for recurrent neural network language models

The recurrent neural network language model (RNNLM) has been demonstrated to consistently reduce perplexities and automatic speech recognition (ASR) word error rates across a variety of domains. In this paper we propose a pre-training method for the RNNLM, by sharing the output weights of the feed forward neural network language model (NNLM) with the RNNLM. This is accomplished by first fine-tu...

متن کامل

the effect of lexically based language teaching (lblt) on vocabulary learning among iranian pre-university students

هدف پژوهش حاضر بررسی تاثیر روش تدریس واژگانی (واژه-محور) بر یادگیری لغات در بین دانش آموزان دوره پیش دانشگاهی است. بدین منظور دو گروه از دانش آموزان دوره پیش دانشگاهی (شصت نفر) که در سال تحصیلی 1389 در شهرستان نور آباد استان لرستان مشغول به تحصیل بودند انتخاب شده و به صورت قراردادی گروه آزمایش و گواه در نظر گرفته شدند. در ابتدا به منظور اطمینان یافتن از میزان همگن بودن دو گروه از دانش واژگان، آ...

15 صفحه اول

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: SEEU Review

سال: 2023

ISSN: ['2199-630X', '1409-7001']

DOI: https://doi.org/10.2478/seeur-2023-0035